Une différente approche
de la relativité restreinte.
Peut-être connaissez-vous bien la théorie de la
relativité restreinte ou bien vous n'en avez qu'une vision vulgarisée.
Toujours est-il que vous l'avez certainement découverte par le biais
de ses aspects physiques, constance de la vitesse de la lumière,
contraction des longueurs, dilatation des durées, etc., à
la consonance quelque peu magique et tout au moins loin de l'expérience
quotidienne.
Je me propose ici de vous faire appréhender la relativité
d'une façon différente, qui vous le verrez parle parfois
mieux au sens commun. Celle-ci ne fait appel qu'à des concepts mathématiques,
mais que cela ne vous rebute pas, ils ne sont pas très compliqués. Je ne rappelerai pas la description classique de la relativité; si vous souhaitez vous en rememorer les aspects principaux, il y a de nombreux sites pour cela, tel qu'ici ou le luxorion.
Afin de faire ressortir les aspects parlants, j'ai découpé
cet exposé en deux parties; la première va vous mettre à
contribution , et la seconde donne
la réponse. Donc ne regardez pas tout de suite la seconde partie,
svp. En conclusion je discuterai des avantages de cette description de
la relativité restreinte vis-à-vis de la description physique.
Comme la seconde partie peut rebuter certains lecteurs, je les invite à
lire la conclusion plutôt que de quitter cette page. En effet, il
serait dommage de ne pas comprendre les conséquences de cette description.
Quelques exercices ...
Rassurez-vous, ils sont simples et le but est de vous
faire trouver par vous-même cet autre point de vue. Vous n'avez besoin
que de connaissances de lycée en géométrie et d'un
peu de calcul.
Faisons d'abord un rappel, si M et N sont deux
quadri-vecteurs position de coordonnées (xM, yM,
zM, c.tM) et (xN, yN, zN,
c.tN), leur produit scalaire est :
M.N = xM.xN + yM.yN
+ zM.zN - c².tM.tN
D'autre part, la transformation de Lorentz s'écrit
:
x' = g(x - vt)
y' = y
z' = z
t' = g(t - vx/c²)
avec
g = (1 - b²)-1/2
b = v/c
-
Sachant cela, pouvez-vous dire ce que devient le produit scalaire, après
avoir appliqué la transformation de Lorentz à M et
N ? Comme y et z ne jouent ici aucun rôle ils peuvent être
éliminés du calcul pour simplifier.
-
Que pouvez-vous en déduire de la dépendance vis à
vis de cette transformation de,
-
la distance
-
une autre grandeur tirée du produit scalaire et de la distance (je
vous laisse trouver laquelle).
-
Enfin, quelles sont les transformations que vous connaissez qui ont les
propriétés que l'on vient de montrer ? Parmi ces deux-là,
laquelle ne peux pas être la transformation de Lorentz ? Conclusion.
La soluce ...
Si vous avez déjà lu des livres de vulgarisation de
la relativité comme celui d'Einstein lui-même (cf. annexe
2), vous savez peut-être déjà de quoi il s'agit.
Cette transformation conserve la distance et le produit scalaire,
donc les angles. La translation et la rotation sont deux transformations
ayant ces propriétés, mais la translation déplace
l'origine du repère, ce qui n'est pas le cas ici.
Donc, la transformation de Lorentz est une rotation.
La suite fait appel à des notions de calcul
matriciel. Pour savoir l'essentiel dans ce domaine, voir en fin
de page.
Pourtant, la matrice de transformation g
ne ressemble pas à une matrice de rotation avec ses termes tendant
vers l'infini et sa symétrie. En ne gardant dans la suite que les
deux dimensions utiles, x et c.t, elle se note :
g = | g -gb|
|-gb g |
Une matrice de rotation L doit répondre aux deux propriétés
:
-
det L = 1
-
tL = L-1 soit L.tL
= tL.L = I
g répond à la première
propriété, g²-g²b²
= 1, mais pas à la seconde. C'est normal car cette propriété
s'exprime en fait plus généralement et met ici en jeu la
matrice h (note 2)
|1 0|
|0 -1|
Il existe une autre démonstration qui s'appuie sur une représentation
complexe de l'espace de Minkowsky. Si L s'écrit en général
|a b|
|c d|
alors on a les cinq relations suivantes
b² = c²
a² = d²
ad - bc = 1 (det)
ac + bd = 0
ab + cd = 0
En triturant tout ça, on arrive à l'expression
connue
| a b|
|-b a|
Mais rien n'interdit à a et b d'être imaginaires, tout
comme Minkowsky avait rendu la coordonnée de temps imaginaire. Si
je pose maintenant a = c et b = is, je remarque que,
-
det L = c² - s² = 1
-
la distance euclidienne d = x² + y² est conservée
Ça prend forme ! Le déterminant de L a la forme
de celui de g (différence de carrés)
et si y = it (Minkowsky) on retrouve l'expression de la distance en relativité
et la même forme que la transformation de Lorentz, malgré
la présence de i.
Enfin, si on retourne à l'expression classique de la transformation
(matrice symétrique à coefficients réels) et qu'on
combine deux transformations g1
et g2, on devrait aussi en
trouver une troisième qui est une rotation. Or les coefficients
peuvent s'écrire ainsi :
c1.c2 + s1.s2
c1.s2 + c2.s1
qui font immédiatement penser à des fonctions trigonométriques.
La solution est simple, et l'expression du déterminant
de L doit y faire penser. c et s sont les fonctions hyperboliques
ch et sh et l'angle de la rotation est un angle hyperbolique, ou, si on
se souvient des formules
sin iu = i.sh u
cos iu = ch u
c'est un angle imaginaire.
| ch(u) ish(u)|
|-ish(u) ch(u)| = L
Et en identifiant à la transformation de Lorentz
g = ch u
gb = sh u
b = th u
À noter que cette dernière expression
explique pourquoi il existe une vitesse limite infranchissable; une tangente
hyperbolique ne dépasse jamais 1 (remarque, on choisi c car cette
vitesse vérifie cette propriété).
Bien, j'ai fait toute cette démonstration car en relativité,
il n'est pas évident que l'angle soit conservé; si on écrit
le produit scalaire ||M||.||N||.cos(u), il peut arriver qu'il
ne soit pas nul alors qu'une distance l'est.
Ainsi, avec une seule hypothèse sur l'expression
du produit scalaire (on peut montrer que cela se rapporte aux deux conditions
sur L, voir note 2), en ne traitant qu'avec
des valeurs réelles et en élargissant la définition
d'un angle, on peut démontrer rigoureusement que la transformation
de Lorentz est une rotation.
Discussion
Ce qui est intéressant, c'est de voir à posteriori
comment on peut interpréter ce résultat. La relativité
est évidemment issue de l'observation; les principes physiques sur
lesquels elle repose ont été suggérés par l'expérience.
Mais on aurait tout aussi bien pu se demander quelles transformations les
plus générales possibles on pouvait faire subir aux coordonnées
tout en conservant quelques propriétés (la distance par exemple).
En fait, il conviendrait de les triturer de toutes les manières
envisageables puis de voir ce qui colle avec la réalité.
Faire apparaître des nombres imaginaires ou un produit scalaire non
usuel ne vient pas toujours à l'esprit des physiciens, mais est courant chez
les mathématiciens.
Et c'est en fait le cas. En posant l'expression de la distance
et son invariance par changement de coordonnées, on retrouve la
rotation 3D bien connue et la rotation d'angle hyperbolique (moyennant
une définition plus étendue de ce qu'est une rotation). De
là, on retrouve les résultats de la relativité, dont
-
il existe une vitesse limite (|b| = |th u|
<= 1), qu'on identifie à celle de la lumière.
-
la vitesse de la lumière est la même dans tout référentiel
(composition des vitesses : b3 =
(b1 + b2)
/(1 + b1.b2)
)
-
la contraction et la dilatation des distances et des durées (ch
u >= 1)
et on peut identifier cette rotation à la transfo de Lorentz en
écrivant la quatrième coordonnée : c.t. Mais indépendamment
de cela, la relativité peut ainsi être retrouvée uniquement
sur des principes géométriques, sans faire appel à
des notions physiques (bien qu'il faille la physique au moins pour confirmer
l'existence de cette transfo. C'est une interprétation purement
géométrique de la physique. Si vous arrivez à
comprendre cela, vous devriez plus facilement comprendre que d'autres lois
physiques puissent être vues sous un angle purement géométrique.
C'est le cas de la gravitation en particulier.
Bon, j'espère ne pas trop vous avoir abruti de formules.
Elles me semblaient nécessaires pour mieux comprendre le raisonnement
et seront un support pour qui souhaitera refaire les calculs par lui-même.
Et surtout, j'espère ne pas avoir été obscure.
1-Rappel de calcul matriciel
Ci-dessous, quelques notions de base sur les matrices.
Comme vous le verrez, il n'y a rien de difficile, dès lors qu'on
sait ce qu'est une matrice et que l'addition et la multiplication ne nous
sont pas inconnues.
Une matrice est un tableau de nombres. Exemple :
| 1 2 0 -2 -1 |
M = |-1 0 2 3 -3 |
| 3 1 -2 0 1 |
Un coefficient, un des nombre de la matrice, est noté
mij, où i est le numéro de la ligne et j le numéro
de la colonne où se trouve se coefficient. Ainsi, m2 5
= -3.
Un vecteur est une matrice particulière à
une seule dimension. On en trouve de deux types, les vecteurs colonnes
et les vecteurs lignes. Exemples :
| 1 |
u = |-1 |
| 0 |
et v = | 0 1 0 0 |
Une autre matrice particulière est la matrice
unité, I, carrée et où seuls les coefficients
de la diagonale sont non nuls et égaux à 1.
La transposée d'une matrice M est
la matrice obtenue en inversant les lignes et les colonnes de M.
On la note tM. Ainsi la transposée de la matrice
ci-dessus s'écrit :
| 1 -1 3 |
| 2 0 1 |
tM = | 0 2 -2 |
|-2 3 0 |
|-1 -3 1 |
De plus, la transposée d'un vecteur colonne est
un vecteur ligne et vice-versa. On appelle en général vecteur,
une colonne et une ligne, transposée d'un vecteur.
On peut multiplier à droite la matrice A
par la matrice B si elles répondent à la règle
suivante :
le nombre de colonnes de A est égale au nombre de
lignes de B.
Ce produit matriciel se note A.B et a pour résultat
une autre matrice dont les coefficients se déterminent ainsi :
cij = Sk aik.bkj
le coefficient à la croisée de la ligne i et la colonne j de C
est la somme des produits des coefficients de la ligne i de A avec
les coefficients correspondants de la colonne j de B. Un exemple sera
plus parlant. Le coefficient 2, 3 du produit M.tM
est :
| . . 3 |
| . . . | | . . . . . | | . . 1 |
| . . c | = |-1 0 2 3 -3 | * | . . -2 |
| . . . | | . . . . . | | . . 0 |
| . . 1 |
c = -1*3 + 0*1 + 2*(-2) + 3*0 + (-3)*1
Pour vérifier que vous avez compris, le résultat
de cet exemple est :
|10 -4 4 |
M.tM = |-4 23 -10 |
| 4 -10 15 |
Pour finir, le cas particulier du produit de la transposée
d'un vecteur u par un autre vecteur v est le produit scalaire usuel de
ces vecteurs :
| u1|
tv.u = |v1 ... vn|*|...|
| un|
À noter qu'un scalaire est une matrice à
une ligne et une colonne. En fait, chaque coefficient est le produit scalaire
d'une ligne par une colonne.
Le déterminant d'une matrice est un scalaire.
Il ne peut être calculé que si la matrice est carrée
(autant de ligne que de colonnes). L'expression générale
étant plutôt compliquée (elle met en jeu la permutation
des coefficients), je me contenterai ici d'exprimer le déterminant
d'une matrice 2,2 qui nous est seul utile ici.
si M = |a b|
|c d|
alors det M = a.d - b.c
Pour information, le déterminant de M.tM
est :
det (M.tM) = 10*23*15 + 4*(-4)*(-10) +
4*(-4)*(-10) - 10*(-10)² - 4²*23 - 15*(-4)² = 2162
Une matrice carrée M possède
un inverse si son déterminant est non nul. Elle est notée
M-1. Son calcul est quelque peu compliqué, il
fait intervenir entre autre le déterminant, et n'a pas d'intérêt
ici, aussi je ne l'explique pas. Sachez simplement que les produits à
droite et à gauche avec la matrice d'origine égalent la matrice
unité.
M.M-1 = M-1.M = I
Toutes ces définitions s'agencent encore entre
elles. À titre d'exercice, vous pourriez chercher comment ...
2-Expression générale de la rotation
La propriété essentielle d'une rotation
est de conserver la distance par changement de repère. Si u
est le vecteur reliant les points A et B, la distance de A à B est
la racine du produit scalaire usuel de u :
d² = tu.u
Mais un produit scalaire s'écrit plus généralement,
tu.M.v
Dans le cas où M est I, on retrouve le produit
scalaire usuel.
Un changement de repère s'écrit
u' = P.u
où P est une matrice carrée de déterminant
non nul.
Combinons tout cela. La propriété d'invariance
s'écrit alors,
d² = tu.M.u = tu'.M.u'
En exprimant u' en fonction de u on obtient,
d² = tu.tP.M.P.u
Cela doit être vrai quelque soit u, donc,
M = tP.M.P
Ceci est l'expression générale qui remplace
L.I.tL = tL.I.L = I
La seconde condition, det P = 1, est implicite.
Une propriété du déterminant est l'associativité,
det (A.B) = det A * det B
de plus,
det(tP) = det P
on en déduit facilement des relations précédentes
que
(det P)² = 1
Cette relation est encore plus générale.
Elle comporte les rotations, mais aussi les symétries (point, droite,
plan, ...). On se restreint à l'ensemble des matrices de déterminant
positif qui regroupe toutes les rotations.
Dans le cadre de la relativité, M est
la matrice h. Il est alors facile de
constater que g vérifie la condition
sur les rotations
h = g.h.g
Ici, il n'a été tenu compte que de
deux dimensions. En réalité, il y en a quatre. La matrice
h s'écrit alors
|1 0 0 0|
h = |0 1 0 0|
|0 0 1 0|
|0 0 0 -1|
et gère à la fois les rotations de l'espace qui nous sont
familières, et les rotations relativistes. À noter qu'il
existe une autre convention où les signes sont inversés.
Mais cela ne change rien au principe.
12 Octobre 2002